氣象數據庫的特質
氣象數據庫的特質
鄭子路
2017年8月
香港地理面積雖小,卻擁有一個非常稠密的天氣觀測網絡(圖一)。在香港約1,100平方公里的陸地上[1],就有超過三百個自動氣象站和雨量站,大部分由香港天文台所建立。由於自動氣象站一般都會同時測量多種不同的氣象數據,所以每分鐘約有2,500多組自動觀測數據由本港各區透過通訊網路傳到天文台。這些原始數據經過整理後會存入天文台其中一個專責處理本地及鄰近地區觀測數據的數據庫中,成為預報及觀測報告的重要數據來源之一。

圖一 一個非常稠密的天氣觀測網絡覆蓋全港。
或許你會問,每分鐘3,000組也不到的數據量,何需用上複雜的數據庫呢?其實在演算及品質管理這些數據的過程中,需要多次從數據庫提取及修改,而產生多達20,000組的衍生數據及成品數據,亦需存入數據庫中。因此,數據的處理量在短時間內以倍數增加,而數據更被數十個應用程式不斷地提取以製作不同的氣象報告及預報產品。還有,該數據庫亦需同時處理鄰近地區數量龐大的天氣數據,所以天文台確實有需要利用數據庫出色的效能來處理氣象數據。
為方便氣象人員理解及分析天氣狀況,技術支援人員會盡量提供同一觀測時間的氣象數據給他們參考。因此在一般情況下,各氣象站都會同時測量氣象元素,並把數據實時傳送到天文台,導致氣象數據庫每每需要在數十秒內同時處理大量原始數據、衍生數據和成品數據。當高峰期過後,數據庫的工作量會顯著回落,直至下一次數據收集週期。換句話說,氣象數據庫處理的工作量在同一週期內的不同時段都有顯著的分別(圖二)。氣象數據庫需要處理這種具爆發性的數據潮,跟一般商業數據庫的日常運作頗不相同,因此,氣象數據庫相對於一般商業用數據庫需要有較優良的運作性能才能避免數據丟失和延遲。

圖二 氣象數據庫的工作量隨時間變化示意圖。圖中顯示週期性工作量顯著變化的特質。
其實這種氣象數據庫工作量起伏的特點在金融業的數據處理上也很常見,但天氣系統跟金融市場最大的分別大概是天氣系統沒有停下來的一刻,而金融市場卻有「休市」的時候。儘管全球不同時區的金融市場已高度連結起來,但關係還遠不及處理全球天氣數據的系統那樣緊密。在氣象的世界裹,氣象數據「7x24」的在流轉,實難找到「休市」的時間可供氣象數據庫作出定期維修。因此,氣象數據庫對於硬體及軟體的可用程度以至災難恢復的準備都有嚴格要求。科技日新月異,數據庫技術亦推陳出新,天文台會繼續致力採用先進及最合適的技術為市民提供服務。
參考資料:
[1] 這連結會以新視窗打開。香港統計數字一覽
[1] 這連結會以新視窗打開。香港統計數字一覽